(網(wǎng)經(jīng)社訊)8月13日消息,阿里通義大模型繼續(xù)開源,Qwen2系列開源家族新增音頻語言模型Qwen2-Audio。Qwen2-Audio可以不需文本輸入,直接進(jìn)行語音問答,理解并分析用戶輸入的音頻信號,包括人聲、自然音、音樂等。
據(jù)網(wǎng)經(jīng)社產(chǎn)業(yè)電商臺(B2B.100EC.CN)獲悉,該模型在多個權(quán)威測評中都顯著超越先前的最佳模型。通義團(tuán)隊(duì)還同步推出了一套全新的音頻理解模型測評基準(zhǔn),相關(guān)論文已入選本周正在舉辦的國際頂會ACL 2024。
根據(jù)Qwen2-Audio技術(shù)報(bào)告,Qwen2-Audio的模型結(jié)構(gòu)包含一個Qwen大語言模型和一個音頻編碼器。在預(yù)訓(xùn)練階段,依次進(jìn)行ASR、AAC等多任務(wù)預(yù)訓(xùn)練以實(shí)現(xiàn)音頻與語言的對齊,接著通過SFT(監(jiān)督微調(diào)) 強(qiáng)化模型處理下游任務(wù)的能力,再通過 DPO(直接偏好優(yōu)化)方法加強(qiáng)模型與人類偏好的對齊。
此外,通義團(tuán)隊(duì)同步開源了基礎(chǔ)模型 Qwen2-Audio-7B 及其指令跟隨版本Qwen2-Audio-7B-Instruct,用戶可以通過Hugging Face、魔搭社區(qū)ModelScope等下載模型,也可以在魔搭社區(qū)“創(chuàng)空間”直接體驗(yàn)?zāi)P湍芰Α?/p>
浙江網(wǎng)經(jīng)社信息科技公司擁有18年歷史,作為中國領(lǐng)先的數(shù)字經(jīng)濟(jì)新媒體、服務(wù)商,提供“媒體+智庫”、“會員+孵化”服務(wù);(1)面向電商平臺、頭部服務(wù)商等PR條線提供媒體傳播服務(wù);(2)面向各類企事業(yè)單位、政府部門、培訓(xùn)機(jī)構(gòu)、電商平臺等提供智庫服務(wù);(3)面向各類電商渠道方、品牌方、商家、供應(yīng)鏈公司等提供“千電萬商”生態(tài)圈服務(wù);(4)面向各類初創(chuàng)公司提供創(chuàng)業(yè)孵化器服務(wù)。
網(wǎng)經(jīng)社“電數(shù)寶”電商大數(shù)據(jù)庫(DATA.100EC.CN,免費(fèi)注冊體驗(yàn)全庫)基于電商行業(yè)18年沉淀,包含100+上市公司、新三板公司數(shù)據(jù),150+獨(dú)角獸、200+千里馬公司數(shù)據(jù),4000+起投融資數(shù)據(jù)以及10萬+互聯(lián)網(wǎng)APP數(shù)據(jù),全面覆蓋“頭部+腰部+長尾”電商,旨在通過數(shù)據(jù)可視化形式幫助了解電商行業(yè),挖掘行業(yè)市場潛力,助力企業(yè)決策,做電商人研究、決策的“好參謀”。
【版權(quán)聲明】秉承互聯(lián)網(wǎng)開放、包容的精神,網(wǎng)經(jīng)社歡迎各方(自)媒體、機(jī)構(gòu)轉(zhuǎn)載、引用我們原創(chuàng)內(nèi)容,但要嚴(yán)格注明來源網(wǎng)經(jīng)社;同時,我們倡導(dǎo)尊重與保護(hù)知識產(chǎn)權(quán),如發(fā)現(xiàn)本站文章存在版權(quán)問題,煩請將版權(quán)疑問、授權(quán)證明、版權(quán)證明、聯(lián)系方式等,發(fā)郵件至NEWS@netsun.com,我們將第一時間核實(shí)、處理。